Offre de stage M2 BRGM/Univ.Orléans : Fusion Textes/images sur des tweets de gestion de crise

When:
10/01/2023 – 11/01/2023 all-day
2023-01-10T01:00:00+01:00
2023-01-11T01:00:00+01:00

Offre en lien avec l’Action/le Réseau : – — –/Doctorants

Laboratoire/Entreprise : BRGM, LIFO, PRISME
Durée : 5 mois
Contact : guillaume.cleuziou@univ-orleans.fr
Date limite de publication : 2023-01-10

Contexte :
Aujourd’hui, 2/3 des communes françaises sont considérées comme exposées à des catastrophes naturelles (inondations, séismes, etc.). Il est établi que cette situation s’accentuera dans les prochaines décennies, si bien que l’analyse des témoignages diffusés de manière agile et spontanée sur les réseaux sociaux (tels que Twitter) constituera un formidable outil pour qualifier rapidement et automatiquement l’ampleur des catastrophes et ainsi contribuer aux stratégies de gestion de crise.

Des travaux récents menés dans ce domaine exploitent les techniques d’apprentissage de représentations vectorielles dans des espaces sémantiques pour mener une analyse centrée soit sur le contenu textuel des posts, soit sur les images et/ou les vidéos associées. Bien que ces deux niveaux d’analyse soient complémentaires, l’analyse conjointe des images et du texte qui leur est associé reste difficile à mettre en oeuvre dans le contexte de la gestion de crise.

Sujet :
Certaines techniques multimodales exploitant notamment les captions des images au moyen de Transformers (BERT) ont montré des performances prometteuses sur des tâches de classification sur le corpus de tweets en langue anglaise CrisisMMD.

L’objectif du stage est d’adapter ces techniques multimodales au traitement des tweets en langue française. Cette adaptation offrira différents choix dans la chaîne de traitement, dont – en particulier – la possibilité de travailler dans des espaces de représentation mono- ou multilingues. Il s’agira alors de (1) proposer plusieurs architectures d’implémentation et (2) de les évaluer sur (3) un jeu de données préparé pour l’occasion à partir de sources existantes au BRGM.

L’objectif du stage est d’adapter ces techniques multimodales au traitement des tweets en langue française. Cette adaptation offrira différents choix dans la chaîne de traitement, dont – en particulier – la possibilité de travailler dans des espaces de représentation mono- ou multilingues. Il s’agira alors de (1) proposer plusieurs architectures d’implémentation et (2) de les évaluer sur (3) un jeu de données préparé pour l’occasion à partir de sources existantes au BRGM.

Profil du candidat :
Vous disposez d’une culture scientifique en Machine Learning et d’une expérience dans la mise en oeuvre de modèles de Deep Learning (ex. Transformers). Vous manifestez un intérêt pour l’analyse de données textes et/ou images.

Formation et compétences requises :
Vous êtes étudiant·e en master et/ou école d’ingénieur en Mathématiques/Informatique.

Adresse d’emploi :
Merci d’adresser votre candidature (CV + notes + lettre de motivation) avant le 10/01/2023 à badreddine.farah@univ-orleans.fr et guillaume.cleuziou@univ-orleans.fr.

Document attaché : 202212090739_Annonce_StageM2_2023_CrisisMMDeepL_Orleans.pdf